検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 2 件中 1件目~2件目を表示
  • 1

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

口頭

格子ボルツマン法への適合細分化格子法の導入と複数GPU化のための諸実装

長谷川 雄太

no journal, , 

本研究では複雑形状物体周りの空力解析、ならびに都市域の局所風況解析を大規模LES計算で実現するため、適合細分化格子法を導入した格子ボルツマン法の複数GPU計算の実装を行ってきた。本発表では、開発コードの実装において行ってきた単一GPU計算の高速化、MPI実装における通信の最適化、最新のGPU環境におけるノード内複数GPU計算に特化した並列実装法といった、複数GPU計算に関わる種々の最適化手法について発表する。

口頭

Enhancing intra-node Multi-GPU stencil calculations on DGX-2 using concurrent-addressing with Unified Memory

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

no journal, , 

原子力機構におけるCityLBMプロジェクトでは、AMR(Adaptive mesh refinement; 適合細分化格子法)に基づく実時間都市風況予測コードの開発を行ってきた。次世代のCityLBMコードにおいては、予測の信頼性を向上するためにアンサンブル計算の導入が求められている。このためには、メモリ使用量を1つの計算あたり1ノードないし4$$sim$$16GPUの規模に抑える必要がある。本研究では、AMRコードにおけるメモリ使用量の削減およびデータ通信の高速化を目的として、CUDAのUnified Memoryを用いたイントラノード複数GPU計算の実装を試行した。Unified MemoryへのアクセスがHBM2(同一GPU)またはNVLink(隣接GPU)から自動的に判別されるため、比較的簡便に複数GPU計算を実装することができる。等間隔格子上で3次元拡散方程式および格子ボルツマン法の複数GPU計算コードを実装し、弱スケーリングおよび強スケーリングを測定することでNVLinkの性能テストを行った。

2 件中 1件目~2件目を表示
  • 1